max length | sentence |
---|---|
7 | Okolnosti tragické události prověřuje policie. |
6 | Nejméně fyzicky trestaní bývají naopak jedináčci. |
6 | Estonci vymysleli takový zajímavý koncept datové ambasády. |
6 | Palčivou otázku chtějí vyřešit poměrně rychle. |
6 | Ztrácela většina titulů, nejvíce finanční sektor. |
6 | Policie postupovala profesionálně,“ sdělil redakci iDNES.cz vicepremiér Rakušan. |
5 | Izraelský parlament schválil zákon, který omezuje pravomoci tamního nejvyššího soudu. |
5 | Ovšem podle zdrojů Sportu tentokrát okolnosti nejsou nakloněné. |
5 | Přehled deseti nejbohatších Čechů podle časopisu Forbes. |
5 | Silnice dostanou rating podle počtu nehod. |
5 | Pohyb nabízí stimulaci, která ovlivňuje motorické chování pacienta. |
5 | Podle výzkumníkù èlenùm vlády dùvìøují pochopitelnì pøedevším volièi stran vládní koalice. |
5 | Zveřejnili proto další záběry pachatele. |
5 | Přesně takhle chceme nastoupit proti Raumě. |
5 | Umělé schéma Pražáci proti venkovu neplatí. |
5 | Pavel zkritizoval vládu kvůli rozpočtu. |
5 | Ostatní zahraniční klientela tvoří jednotky procent. |
5 | Jméno soupeře zatím veřejnost nezná. |
5 | Další navíc vypouští přilehlá textilní továrna. |
5 | Tuzemské miliardáře ovšem kabinet chrání. |
5 | Ukrajinské úřady oficiálně ztrátu města nepotvrdily. |
5 | Další článek: Vybíráme nejlepší tlačítkové mobily. |
5 | Místo Petra Gewieseho přišel pětadvacetiletý Radek Jeřábek. |
5 | První prázdninový víkend přinese polojasné počasí. |
5 | Tento úvodní souboj nabídne možná nejlepší zápasovou kvalitu večera. |
5 | Česká tenistka rozhodně neskládá zbraně předčasně. |
5 | Opozice vytýkala šéfce sněmovny způsob řízení schůzí dolní komory. |
5 | Odbor sociálního zabezpečení ministerstva vnitra Vostárkovi obratem zastavil výplatu výsluh. |
5 | Alexander Ovečkin střílí, zatímco David Pastrňák brání. |
5 | Partner extraligy Radegast každoročně uděluje jednomu hráči kamennou helmu. |
In this subsection, we order the sentences by the length of the shortest word an look for the sentences with the largest values. As explained in subsection 4.5.2.3, we expect to find non-typical sentences.
select min(char_length(word)) as a, s.sentence from sentences s, inv_w i, words w where s.s_id=i.s_id and i.w_id=w.w_id and length(sentence)>40 and i.w_id>100 group by s.s_id order by a desc limit 30;
4.5.2.1 Maximum word rank in sentence
4.5.2.2 Average word rank in sentence
4.5.2.3 Sentences consisting of many low frequency words I
4.5.2.4 Sentences consisting of many low frequency words II
4.5.2.5 Sentences consisting of short words only I
4.5.2.6 Sentences consisting of short words only II
4.5.2.8 Sentences consisting of long words only II